#使用selenium登陆并爬取新浪微博

from selenium import webdriver
import time

login_url=r'https://passport.weibo.cn/signin/login?entry=mweibo&res=wel&wm=3349&r=http%3A%2F%2Fm.weibo.cn%2F';
driver=webdriver.Chrome('/Applications/chromedriver');#驱动所在目录地址
driver.get(login_url);#打开页面
driver.implicitly_wait(60);#如果加载完成，就进行下一步，否则最多等待60秒
#使用xpath的方式（selenium也支持其它方式）定位到username这个元素
username=driver.find_element_by_xpath('//*[@id="loginName"]');
#填入用户名
username.send_keys('13548186321');
#用同样的方法，定位和填入密码
password=driver.find_element_by_xpath('//*[@id="loginPassword"]');
password.send_keys('2100wb');
#定位到登陆按钮
submit=driver.find_element_by_xpath('//*[@id="loginAction"]');
#实现点击按钮，进行登陆
submit.click();

#抓取页面上的所有微博。
#观察可知，任何一条完整微博的内容，都是放在属性为‘card card9 line-around’的div中的
#注意和上面的不同，是elements
all_weibo=driver.find_elements_by_xpath('//*[@class="card card9 line-around"]');

for weibo in all_weibo:
	publisher_name=weibo.find_element_by_xpath('header/div/a/span').text;
	content=weibo.find_element_by_xpath('section').text;
	item=[publisher_name,content];
	print(item);